79 research outputs found

    Lenguajes y modelos subyacentes a los grafos de conocimiento

    Get PDF
    A knowledge graph is a large database that integrates information from different data sources, this with the objective of supporting knowledge extraction, and allowing the transformation of such knowledge into value for the users. Such database is represented as a graph where the nodes represent entities, and each edge represents a relationship between nodes, or the attribute of a node. The objective of this article is to review the data models used to represent knowledge graphs, and the query languages that allow to extract explicit and implicit information contained in such graphs.Un grafo de conocimiento es una gran base de datos que integra información desde distintas fuentes de datos, esto con el objetivo de poder extraer conocimiento y transformarlo en valor para los usuarios. Dicha base de datos es representada como un grafo donde los nodos representan entidades, y cada arista representa una relación entre dos nodos, o un atributo de un nodo. El objetivo de este artículo es presentar una revisión de los modelos de datos que se usan para representar grafos de conocimiento, y los lenguajes de consulta que permiten extraer la información explícita e implícita contenida en dichos grafos

    Lenguajes y modelos subyacentes a los grafos de conocimiento

    Get PDF
    Un grafo de conocimiento es una gran base de datos que integra información desde distintas fuentes de datos, con el objetivo de poder extraer conocimiento y transformarlo en valor para los usuarios. Esta base de datos es representada como un grafo, donde los nodos representan entidades, y cada arista representa una relación entre dos nodos o un atributo de un nodo. El objetivo de este artículo es presentar una revisión de los modelos de datos que se usan para representar grafos de conocimiento, y los lenguajes de consulta que permiten extraer la información explícita e implícita contenida en dichos grafos

    Desarrollo de una Plataforma Web para la Oferta y Calificación del Teletrabajo

    Get PDF
    158 p.Las tecnologías de la información y comunicación ofrecen diversas oportunidades, entre ellas el trabajo a distancia denominado teletrabajo. En países desarrollados existen plataformas para la oferta y desarrollo de proyectos a distancia, en las cuales los teletrabajadores puede postular a un sin número de proyectos para luego desarrollarlos completamente desde la comodidad de su hogar. Este nuevo enfoque laboral en Chile está surgiendo desde hace algunos años con iniciativas apoyadas por universidades y empresas, sin embargo, aún no hay soluciones locales ajustadas al mercado. En el presente proyecto he realizado un análisis de entorno, con el objetivo de comprender el ecosistema de los teletrabajadores y a partir de los antecedentes recopilados definí los requerimientos prioritarios que constituyen el núcleo del sistema,luego diseñé una solución usando el patrón modelo vista controlador (MVC)y finalmente desarrollé una solución de Software completamente funcional, apoyado en la fase de codificación por la metodología Test Driven Development (TDD). El producto fue liberado de forma incremental y paso por evaluación de terceros con exitosos resultados.Palabras Claves: Teletrabajo, Freelancer, Test Driven Development, TDD, Desarrollo de Software

    Generación de datos para benchmarking de bases de datos de grafos

    Get PDF
    105 p.Dentro de las bases de datos NoSQL, una nueva generaci´on de motores de bases de datos se puede encontrar. Dentro de este grupo nos enfocamos en las bases de datos de grafos. Esta base de datos es com´unmente utilizada en la actualidad debido a su capacidad para representar, almacenar y manipular informaci´on compleja. Existe un n´umero creciente de iniciativas que implementan y comercializan estas bases de datos, sin embargo no existe una manera de comparar cada base de datos de grafos comercializada. Siguiendo esta direcci´on el documento se enfoca en proveer de las herramientas apropiadas para realizar esta evaluaci´on. Primero, se presenta el dise˜no e implementaci´on de diferentes algoritmos que generan grafos de redes sociales tanto reales como sint´eticas. Posterior a esto se establece un conjunto de consultas que se ejecutar´an para cada una de estas pruebas. Finalmente, una peque˜na evaluaci´on para una base de datos de grafos previamente seleccionada. La implementaci´on de este proyecto fue realizada en Java, utilizando bases de datos relacionales como MySQL, PostgreSQL y una base de datos de grafo DEX. Palabras claves: benchmark, redes sociales, bases de datos de grafos. /ABSTRACT: Among the NoSQL databases a new generation of databases engines can be found.Within this group we focus on a the graph databases. This database is commonly used nowadays due to its capability to represent, store and manipulate complex information. At the time there is a growing number of initiatives that implement and commercialize these databases. However there is no way to compare each graph databases marketed. Following this direction the document focuses on provide the appropriate tools to make this evaluation. Firstly it is presented the design and implementation of different algorithms that generate graphs of social networks both real and synthetic. Afterward it is established a set of queries to be executed for each of the tests. Finally a small evaluation for a graph database previously selected is detailed. The implementation of this project was done in Java, using relational databases such as MySQL, PostgreSQL and graph database DEX. Keywords: benchmark, social networks, graph databases

    Estudio y comparación de bases de datos orientadas a grafos

    Get PDF
    90 p.Un grafo es básicamente un conjunto de puntos (vértices) en el espacio, que están conectados por un conjunto de líneas (aristas). Como una de las formas más generales de modelado de datos, un grafo permite representar fácilmente entidades, sus atributos y sus relaciones.Las Bases de Datos Orientadas a Grafos (BDOG) se caracterizan porque las estructuras de datos para el esquema e instancia se basan en modelos de datos de grafo.Estos modelos se iniciaron en los años ochenta y a principios de los noventa, junto con modelos orientados a objetos. Su influencia decayó poco a poco con la aparición de nuevos modelos de bases de datos. Recientemente, la necesidad de gestionar la informacióon a través de una estructura de grafo y las limitaciones de las bases de datos tradicionales (en particular el modelo relacional), para cubrir las necesidades de las aplicaciones actuales ha llevado al desarrollo de nuevas tecnologías, y por consiguiente ha restablecido la importancia de esta área. El objetivo principal de este estudio es realizar una comparación sistematica de bases de datos de grafo.En este trabajo se presenta una revisión de las bases de datos de grafo actuales y su comparación de acuerdo a algunas caracterìsticas de modelado de datos. Entre las características evaluadas se incluyen: almacenamiento de datos, representación de entidades y relaciones, operación y manipulación de datos (lenguajes de consulta de grafos e interfaces de programación), y restricciones de integridad. Adicionalmente,se presenta una evaluaciçon empírica basada en pruebas de carga y consulta de datos. Este trabajo permite conocer y comparar, de manera teórica y práctica,las capacidades de modelado y ejecución entregadas por cada base de datos de grafo./ABSTRACT: A graph is basically a set of points (vertices) in space, which are connected by a set of lines (edges). As one of the most general forms of data modeling, a graph easily allows the representation of entities, their attributes and their relationships. Graph-oriented Databases (GODB) are characterized because their data structures for the scheme and instance are based on graph data models. These models began in the eighties and early nineties, along with object-oriented models. Their influence gradually faded with the emergence of new models of databases. Recently, the need to manage information through a graph structure and the limitations of traditional databases (in particular the relational model), to meet the needs of current applications has led to the development of new technologies, and therefore restored the importance of this area. The main objective of this study is to perform a systematic comparison of graph databases. This work presents a review of the current graph databases and their comparison according to well-defined data modeling features. Among the evaluated features we include: data storage, representation of entities and relationships, data operation and manipulation (graph query languages and application programming interfaces), and integrity constraints. Additionally, we present an empirical evaluation based on load and query data testing. This work allows to know and compare, from a theoretical and practical point of view, the modeling and execution capabilities provided by each graph database

    Diseño e implementación de métricas de similitud entre frases

    Get PDF
    156 p.Los servicios de traducción automática son sin duda una herramienta útil en la actualidad, puesto que ayudan en la comunicación facilitando la comprensión de ideas expresadas entre dos idiomas. Sin embargo, aún necesitan de mucho refinamiento porque en general cometen bastantes errores. En el caso particular entre Inglés - Español dado que ambos idiomas se basan en reglas gramaticales tan diferentes, las traducciones de un idioma al otro y viceversa se tornan complejas. Los errores no sólo son gramaticales sino que además las traducciones en ocasiones suelen ser literales perdiendo por completo el sentido de la idea que el texto original desea expresar.Esta memoria pretende colaborar con las mejoras a las traducciones automáticas específicamente entre los idiomas Inglés y Español, basándose en la idea de que se puede implementar una buena medida de calculo de similitud entre frases. El objetivo de una medida de este tipo es identificar y calificar frases candidatas a ser la mejor traducción para una frase que se traducen desde el Inglés al Español. Con esto, se pueden ofrecer más opciones de traducción para una idea y por ende, al ampliar la gama de opciones es posible capturar dentro de los resultados el real sentido que a una frase se le quiere impregnar.Para cumplir con lo anterior, en este trabajo se realiza una investigación sobre métodos existentes para medir similitud entre palabras, de los cuales se eligieron tres para su implementación. Luego del estudio de dichas medidas se realizan propuestas originales para medir similitud exclusivamente entre frases y que se complementen con las métricas para palabras. De esto surgen tres medidas bases: Distancia de Edición adaptada, Medida secuencial y Métrica básica, de las cuales sólo las dos primeras se refinan con implementaciones que incorporen funciones para medir similitud entre palabras.Finalmente, se testean las propuestas comprobando que en su conjunto son capaces de recuperar y posicionar bastante bien frases potenciales a ser mejores traducciones que una frase recibida en Español y que supone ha sido traducida desde el Ingles. Palabras claves: Traducción automática, similitud entre frases, noción básica de similitud, Distancia de Edición, Damerau-Levenshtein, WordNet./ABSTRACT:The machine translation services are certainly a useful tool at present, since they help in facilitating communication of ideas expressed understanding between two languages. However, much still needs refinement because generally commit numerous errors. In the particular case among English - Spanish since both languages ??are based on grammar rules so different translations from one language to another and vice versa become complex. Mistakes are not only grammatical but also sometimes translations are usually literal losing all sense of the idea that the original text wishes. This report aims to contribute to improvements specifically to automatic translations between English and Spanish, based on the idea that you can implement a good measure for calculating similarity between sentences. The aim of a measure of this type is to identify and qualify candidates for phrases best translation for a phrase translated from English to Spanish. With this, they can offer more translation options for an idea and thus to extend the range of options you can capture the results in the real sense as a phrase you want to impregnate. To accomplish this, in this paper an investigation of existing methods is performed to measure similarity between words, of which three were chosen for implementation. After studying original proposals such measures are performed to measure similarity between sentences only and that complement the metrics for words. Edit Distance adapted, sequential measurement and basic metrics, of which only the first two are refined implementations that incorporate functions to measure similarity between words this basis three measures arise. Finally, check that the proposals as a whole are able to recover well enough potential and position statements to be better received than a phrase translations in Spanish and has been translated means from English are tested. Keywords: Machine Translation, similarity between sentences, basic notion of similarity, Edit Distance, Damerau-Levenshtein, WordNet. actualidad, puesto que ayudan en la comunicación facilitando la comprensión de ideas expresadas entre dos idiomas. Sin embargo, a necesitan de mucho refinamiento porque en general cometen bastantes errores. En el caso particular entre Inglés -español Español dado que ambos idiomas se basan en reglas gramaticales tan diferentes, las traducciones de un idioma al otro y viceversa se tornan complejas. Los errores no sólo son gramaticales sino que además las traducciones en ocasiones suelen ser literales perdiendo por completo el sentido de la idea que el texto original desea expresar.Esta memoria pretende colaborar con las mejoras a las traducciones automáticas específicamente entre los idiomas Inglés y Español, basándose en la idea de que se puede implementar una buena medida de cálculo de similitud entre frases. El objetivo de una medida de este tipo es identificar y calificar frases candidatas a ser la mejor traducción para una frase que se traducen desde el Inglés al Español. Con esto, se pueden ofrecer más opciones de traducción para una idea y por ende, al ampliar la gama de opciones es posible capturar dentro de los resultados el real sentido que a una frase se le quiere impregnar.Para cumplir con lo anterior, en este trabajo se realiza una investigación sobre métodos existentes para medir similitud entre palabras, de los cuales se eligieron tres para su implementación. Luego del estudio de dichas medidas se realizan propuestas originales para medir similitud exclusivamente entre frases y que se complementen con las métricas para palabras. De esto surgen tres medidas bases: Distancia de Edición adaptada, Medida secuencial y Métrica básica, de las cuales sólo las dos primeras se refinan con implementaciones que incorporen funciones para medir similitud entre palabras. Finalmente, se testean las propuestas comprobando que en su conjunto son capaces de recuperar y posicionar bastante bien frases potenciales a ser mejores traducciones que una frase recibida en Español y que supone ha sido traducida desde el Inglés. Palabras claves: Traducción automatica, similitud entre frases, noción básica de similitud, Distancia de Edición, Damerau-Levenshtein, WordNet./ABSTRACT: The machine translation services are certainly a useful tool at present, since they help in facilitating communication of ideas expressed understanding between two languages. However, much still needs refinement because generally commit numerous errors. In the particular case among English - Spanish since both languages ??are based on grammar rules so different translations from one language to another and vice versa become complex. Mistakes are not only grammatical but also sometimes translations are usually literal losing all sense of the idea that the original text wishes. This report aims to contribute to improvements specifically to automatic translations between English and Spanish, based on the idea that you can implement a good measure for calculating similarity between sentences. The aim of a measure of this type is to identify and qualify candidates for phrases best translation for a phrase translated from English to Spanish. With this, they can offer more translation options for an idea and thus to extend the range of options you can capture the results in the real sense as a phrase you want to impregnate. To accomplish this, in this paper an investigation of existing methods is performed to measure similarity between words, of which three were chosen for implementation. After studying original proposals such measures are performed to measure similarity between sentences only and that complement the metrics for words. Edit Distance adapted, sequential measurement and basic metrics, of which only the first two are refined implementations that incorporate functions to measure similarity between words this basis three measures arise. Finally, check that the proposals as a whole are able to recover well enough potential and position statements to be better received than a phrase translations in Spanish and has been translated means from English are tested. Keywords: Machine Translation, similarity between sentences, basic notion of similarity, Edit Distance, Damerau-Levenshtein, WordNet
    corecore